智能论文笔记

情绪分析的研究分散在不同的标签格式（例如，极性类型，基本情感类别和情感尺寸），语言水平（词与句子与话语），当然，（几乎没有资源但更多资源不足）自然语言和文本类型（例如，产品评论，推文，新闻）。由此产生的异质性使得在这些冲突的限制下开发的数据和软件难以比较和挑战整合。为了解决这种不满意的事态，我们在这里提出了一种培训计划，该培训计划学习与不同标签格式，自然语言，甚至不同的模型架构无关的情感共享潜在的情绪。在各种数据集上的实验表明该方法不会产生所需的互操作性，而不会惩罚预测质量。代码和数据在DOI 10.5281 / ZENODO.5466068下存档。

translated by 谷歌翻译

Open video data sharing in developmental and behavioural science

Peter B Marschik , Tomas Kulvicius , Sarah Flügge , Claudius Widmann , Karin Nielsen-Saines , Martin Schulte-Rüther , Britta Hüning , Sven Bölte , Luise Poustka , Jeff Sigafoos

分类：计算机视觉 | 人工智能

2022-07-22

视频录制是一种广泛使用的方法，用于记录研究和临床实践中的婴儿和儿童行为。由于机密性的道德问题，尽管需要共享的大规模数据集的需求仍在增加，因此很少共享视频数据。当涉及基于数据驱动的计算机的方法，例如筛选工具以补充临床评估时，这种需求更加必要。要在遵守隐私保护规则的同时共享数据，是否会出现一个关键问题，这是否会减少数据实用程序？我们通过展示PrechTL的一般运动评估（GMA）来解决这个问题，该评估是一种既定的，全球实践的基于视频的诊断工具，用于早期婴儿，用于检测神经系统缺陷，例如脑瘫。迄今为止，尚无针对婴儿运动分析的共享专家注销的大数据存储库。这样的数据集将大大受益于人类评估者的培训和重新校准以及基于计算机的方法的发展。在当前的研究中，来自前瞻性纵向婴儿队列的序列，总共有19451年可用的通用运动视频片段被随机选择用于人类的临床推理和基于计算机的分析。我们首次证明，通过脸部视频录制的伪造是一种可行的方法。视频修复不影响人类评估者或计算机视觉方法的分类精度，这表明有足够且易于应用的解决方案用于共享运动视频数据。我们呼吁进一步探索有效和隐私规则的方法，以在运动评估以外的科学和临床领域去识别视频数据。这些方法应使共享并将独立视频数据集合并到大型数据库中，以提高科学和公共卫生。

translated by 谷歌翻译

我们研究了摊销优化的使用来预测输入度量的最佳运输（OT）图，我们称之为元。通过利用过去问题的知识和信息来快速预测和解决新问题，这有助于反复解决不同措施之间的类似OT问题。否则，标准方法忽略了过去解决方案的知识，并从头开始重新解决每个问题。元模型在离散设置中超过了log-sinkhorn求解器的标准收敛速率，并在连续设置中凸电势。我们通过在图像，球形数据和调色板之间的离散和连续传输设置中多个数量级来改善标准ot求解器的计算时间。我们的源代码可在http://github.com/facebookresearch/meta-ot上找到。

translated by 谷歌翻译

卷积神经网络已使基于医学图像的诊断有了重大改进。但是，越来越明显的是，这些模型在面对虚假的相关性和数据集转移时易受性能降解，例如，领导者（例如，代表性不足的患者群体的表现不足）。在本文中，我们比较了ADNI MRI数据集上的两个分类方案：使用手动选择的体积特征的简单逻辑回归模型，以及对3D MRI数据训练的卷积神经网络。我们在面对不同的数据集拆分，训练集的性别组成和疾病阶段的情况下评估了受过训练的模型的鲁棒性。与其他成像方式中的早期工作相反，我们没有观察到培训数据集中多数组的模型性能的明确模式。取而代之的是，尽管逻辑回归对数据集组成完全可靠，但我们发现，在培训数据集中包括更多女性受试者时，男性和女性受试者的CNN性能通常会提高。我们假设这可能是由于两性病理学的固有差异。此外，在我们的分析中，Logistic回归模型优于3D CNN，强调了基于先验知识的手动特征规范的实用性，以及需要更强大的自动功能选择。

translated by 谷歌翻译